至顶网

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

少即是多：Google如何让软件开发变得“极简主义”

锁定9月13日，2025 AI创新者大会暨第二届提示工程峰会即将来袭

案例 | 研华助力真健康打造国际首创穿刺手术机器人，安全精准、一针到位

在全国 70 余家三甲医院，真健康穿刺手术机器人实现了“安全精准、一针到位”。依托研华高性能边缘AI硬件与医疗级显示器支撑，这一国产医疗创新突破了传统经验依赖，实现亚毫米级穿刺精度，让医疗更高效、更安全。
亚马逊云科技生成式AI技术创新中心再加码，1亿美元都要做些什么？

亚马逊云科技生成式AI技术创新中心1亿美元的再次投入，将在既有成果的基础上，更精准地聚焦客户当前需求，推动生成式AI和Agentic AI的广泛落地，并借助合作伙伴释放更大的规模效应。
SIGGRAPH｜智能体认知体系“跃迁” NVIDIA Nemotron、Cosmos Reason“双轨” 定义信息与物理边界“推理范式”

NVIDIA于SIGGRAPH上宣布扩展两类面向推理任务的模型体系

人工智能

大语言模型

市场泡沫

2025-08-19

OpenAI CEO阿尔特曼承认当前处于AI泡沫期

OpenAI首席执行官Sam Altman表示，鉴于投资者的AI炒作和大量资本支出，我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋，但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户，是全球第五大网站。由于服务器容量不足，OpenAI无法发布已开发的更好模型，计划在不久的将来投资万亿美元建设数据中心。

阿里巴巴突破AI说话人视频生成技术壁垒：首次实现动作自然度、唇同步准确性和视觉质量的完美平衡

人工智能

音频驱动动画

多目标优化

2025-08-19

阿里巴巴突破AI说话人视频生成技术壁垒：首次实现动作自然度、唇同步准确性和视觉质量的完美平衡

阿里巴巴团队提出FantasyTalking2，通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集，训练三个专业模块分别优化不同维度，再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术，用户评价提升超12%。

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

人工智能

自然语言处理

混合架构优化

2025-08-19

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

英伟达推出新的小型语言模型Nemotron-Nano-9B-v2，拥有90亿参数，在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构，支持多语言处理和代码生成，可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程，并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练，采用企业友好的开源许可协议，支持商业化使用。

人工智能

内存优化

算法创新

2025-08-19

UC Berkeley团队突破AI内存瓶颈：让大模型推理快7倍的神奇方法

UC Berkeley团队提出XQUANT技术，通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7，升级版XQUANT-CL更可实现12.5倍节省，同时几乎不影响模型性能。研究针对现代AI模型特点进行优化，为在有限硬件资源下运行更强大AI模型提供了新思路。

推荐专题

2025戴尔科技峰会 - 破局者智行合璧

驭浪者无疆：智驱全球，无界新航

HPE Zerto Software 为企业数智化保驾护航

驭浪者无疆：智领未来共拓蓝海

出海企业数据合规与安全

驭浪者无疆：跨越山海以智驭远

驭浪者无疆：蜕变新生以定驭变

昇腾AI开发者峰会

鲲鹏开发者峰会

驭浪者无疆：破界而生，重构制造新坐标

鲲鹏异腾开发者大会2025

算启当下即见未来

AI Agent制造业落地实战-从技术场景到效益提升的应用场景全解析

用出海找出口，以科技领航全球新赛道

用出海找出口驾驭“智造升维”的新变量

研华 x Jetson，加速突破边缘AI工业应用边界

用出海找出口——智造升级，全球布局

用出海找出口从“本土制造”到“世界智链”的跃迁

借力打力开天辟地——电信业如何借生成式AI之力，助推行业创新？

数据科学“茶水间——GTC导航篇

2024 亚马逊云科技 re:Invent

数字化转型有奖调研

数字化领航

2023 NVIDIA 初创企业展示报名开启

人工智能

自然语言处理

优化模型

2025-08-19

谷歌翻译将集成AI功能并增加游戏化学习模式

据Android Police报道，谷歌翻译即将迎来重大AI升级。最新版本9.15.114显示新增模型选择器，包含"快速"和"高级"两种模式。快速模式适用于菜单翻译等简单任务，高级模式将使用Gemini技术提供更准确的上下文理解。更新还将加入类似多邻国的练习模式，通过游戏化方式辅助语言学习。这一升级体现了谷歌持续推进语言翻译技术创新的努力。

法国地理院团队让AI学会“编排“地球观测数据：MAESTRO模型如何像指挥家一样协调多源卫星信息

遥感技术

自监督学习

数据融合

2025-08-19

法国地理院团队让AI学会“编排“地球观测数据：MAESTRO模型如何像指挥家一样协调多源卫星信息

法国地理院团队开发的MAESTRO模型通过创新的数据融合策略，成功解决了多源卫星数据协调难题。该模型如指挥家般智能编排不同类型地球观测数据，在树种识别和农作物分割等任务中显著提升准确率，为环境监测、农业生产和城市规划提供强有力技术支撑，展现了AI协调异构数据的巨大潜力。

边缘计算

人工智能

基础设施优化

2025-08-19

边缘AI基础设施的现实挑战与解决方案

随着AI和生成式AI的快速普及，组织在数据处理和应用架构方面面临新挑战。传统集中式架构难以满足现代AI应用的性能需求，推动AI能力向数据生成和决策制定的边缘位置转移。边缘AI部署面临带宽限制、GPU资源需求和运营复杂性等挑战。F5应用交付和安全平台等解决方案通过统一控制和可视化管理，为分布式AI环境提供一致的安全策略和流量管理能力。

图神经网络

自我解释AI

医疗人工智能

2025-08-19

帝国理工学院开发X-Node：图神经网络首次实现“自我解释“，让AI医疗诊断不再是黑匣子

帝国理工学院开发的X-Node框架首次实现图神经网络的自我解释功能，让AI系统中的每个节点都能像医生一样解释自己的诊断思路。该技术通过内置推理模块和自然语言生成，为医疗AI的"黑匣子"问题提供了革命性解决方案，在保持诊断准确性的同时大幅提升了系统的可信度和透明度。

人工智能

模型优化

能源效率

2025-08-19

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

企业普遍认为AI模型需要大量算力，但Hugging Face专家认为应该更智能地使用AI。五个关键策略包括：为特定任务选择合适规模的模型而非通用大模型；将效率设为默认选项，避免不必要的高成本计算模式；通过批处理和精度调整优化硬件利用；推广能耗透明度评级系统；重新思考"更多算力更好"的观念，专注于智能架构和优质数据而非简单扩大GPU集群规模。

人工智能

深度学习

超越人类预测

2025-08-19

史丹佛AI突破：一秒钟预测十年后——机器学习中的超越人类能力边界探索

史丹佛大学AI实验室的突破性研究显示，机器学习模型在复杂时间序列预测任务中展现出超越人类专家的能力。研究涵盖金融、气候、生物三大领域，AI预测准确率比人类专家高出15-25%，处理速度从几天缩短至几秒。这一发现不仅颠覆了对AI能力边界的认知，更为医疗、环保、商业等领域的决策革新开辟了广阔前景，标志着人机协作新时代的到来。

2025-08-19

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

Ovis2.5是阿里集团开发的新一代多模态大语言模型，在视觉感知和推理能力上实现重大突破。

首个生成全身数字人的超级AI模型！斯坦福等顶尖高校联手，让静态照片瞬间“活“起来

人工智能

计算机视觉

深度学习

2025-08-19

首个生成全身数字人的超级AI模型！斯坦福等顶尖高校联手，让静态照片瞬间“活“起来

斯坦福大学等顶尖机构联合研发的MegaPortrait技术实现重大突破，首次让单张静态照片生成高质量全身动态视频成为现实。该技术通过创新的AI架构，能够从一张照片中推断人物特征并生成自然流畅的动作和表情，在视频质量、处理速度和身份一致性方面都超越了传统方法，为教育、娱乐、商业等领域带来革命性应用前景。

人工智能

云计算

跨云集成

2025-08-19

谷歌Gemini大模型登陆甲骨文云平台

谷歌Gemini模型登陆甲骨文云，标志着企业AI应用的重要转变。该集成允许企业用户通过甲骨文云基础设施直接访问Gemini模型，而非仅作为外部API。甲骨文采用多供应商策略，为客户提供更灵活的模型选择。这一合作使Gemini的文本生成、多模态分析等功能可直接嵌入甲骨文应用中，无需迁移数据。同时将集成到未来的甲骨文融合云应用中，包括HR、财务和供应链解决方案，为企业提供更先进的AI自动化能力。

人工智能

深度学习

多模态技术

2025-08-19

当AI开始从声音就能“看出“你的样子：复旦团队揭秘音频重建人像的神奇技术

复旦大学研究团队开发出突破性AI技术，能够仅通过声音重建说话者面部图像。该技术基于声音特征与面部结构的生理关联，使用多层深度学习系统实现声音到图像的精确映射。测试显示生成图像与真实面孔高度相似，在执法、娱乐、医疗等领域具有广阔应用前景，同时也带来隐私保护等伦理挑战。

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

操作系统

微内核技术

实验系统

2025-08-19

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

Debian GNU/Hurd 2025是基于Mach微内核的实验性操作系统最新版本。该版本首次提供可用的x86-64版本，支持USB磁盘和CD驱动器，移植了Rust语言，具备"相当可用"的SMP支持，能够运行约72%的Debian软件包。虽然这是一个高度实验性的系统，不适合普通用户日常使用，但对操作系统研究领域具有重要意义，证明了微内核设计理念仍在持续发展。

多模态AI学会了自己“动手“：清华、科大携手Kwai发布会自主编程处理图像的智能助手

多模态大语言模型

代码生成

强化学习

2025-08-19

多模态AI学会了自己“动手“：清华、科大携手Kwai发布会自主编程处理图像的智能助手

清华、中科大联合Kwai团队开发的Thyme系统实现了多模态AI的重大突破，让AI模型具备了自主编写代码处理图像和进行数学计算的能力。通过创新的两阶段训练策略和GRPO-ATS算法，Thyme在近20个评测基准上都表现出显著性能提升，特别是在高分辨率图像处理和复杂推理任务中表现突出，代表了AI从被动"看图说话"向主动"动手解决问题"的重要转变。

人工智能

数据隐私

用户记录保存

2025-08-19

你的每一个问题、每一条评论，我都在记录

最近OpenAI用户震惊地发现他们的搜索记录出现在Google搜索中。实际上OpenAI明确告知了这一做法，但多数用户未仔细阅读条款。虽然OpenAI已移除相关功能，但因版权诉讼的法院命令，所有用户对话仍被保留。Google的Gemini等AI服务也在记录用户信息以提供个性化服务。这些数据可能在安全漏洞中泄露，用户应谨慎提问敏感话题。

人工智能

学术搜索

信息检索

2025-08-19

中科院软件所首创“论文树状图书馆“：让科研搜索像点餐一样精准到位

中科院软件所开发的PaperRegister系统通过分层索引技术革新学术论文搜索，将传统基于摘要的粗粒度检索升级为支持技术细节的精细化搜索。该系统为每篇论文建立树状信息结构，从概况到具体实现细节分层组织，配合智能视角识别器精准理解用户查询意图。实验显示在细粒度搜索中准确率提升22.6%，响应时间仅2.5秒，为科研信息检索提供了突破性解决方案。

人工智能

量子计算

新型算法

2025-08-19

2035年最热门的十大颠覆性产业

文章分析了2035年可能改变游戏规则的十大产业：包括量子计算和神经形态计算等新一代计算机技术、太空商业化、个性化基因医疗、空间计算与脑机接口、城市农业、空中交通管理、海水淡化技术、沉浸式娱乐、器官按需制造和人形机器人。作者强调这些不是小众领域，而是将成为全球重要的大规模应用技术，需要各国在基础设施、应用研究和人才培养方面提前布局。

3D动画制作

自动骨骼绑定

视频引导动画生成

2025-08-19

南洋理工大学最新突破：让静态3D模型“活“起来，自动骨骼绑定与动画生成技术

南洋理工大学研究团队开发了名为Puppeteer的自动化系统，可将静态3D模型转换为完整的动画资产。该系统包含自动骨骼生成、智能皮肤绑定和视频引导动画制作三大核心功能，基于5.94万个高质量样本的大规模数据集训练。相比传统需要数周的手工制作，Puppeteer可在约30分钟内完成整个流程，在多项指标上显著超越现有方法，为3D内容创作的智能化转型提供了重要技术突破。

人工智能

机器学习

AI安全对齐

2025-08-19

AI“教父“提出让AI具备母性本能引发争议

被誉为"AI教父"的Geoffrey Hinton提出，为防止人工智能威胁人类生存，应向AI灌输"母性本能"，使其像母亲保护孩子一样保护人类。然而这一观点遭到AI界严厉批评。批评者认为母性本能概念过于理想化，可能导致过度保护限制人类自由，且忽略了父性本能的作用。此外，将人类特征赋予AI属于拟人化误区，可能加深公众对AI的错误认知。

人工智能

图像生成

动画制作

2025-08-19

香港中文大学团队让AI成为卡通制作神器：一张图加几笔线稿就能生成完整动画片

香港中文大学等机构联合研发的ToonComposer系统实现了动画制作的重大突破，仅需一张彩色图片和几张线稿草图即可自动生成完整卡通动画。该系统通过稀疏草图注入机制和空间低秩适配器技术，将传统的中间帧绘制和上色工作整合为统一的"后关键帧制作"阶段，大幅提升制作效率。实验显示其在视觉质量和动作连贯性等指标上显著超越现有方法，为动画产业的智能化发展开辟新路径。

推荐资讯

邮件订阅

AI启示录

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

少即是多：Google如何让软件开发变得“极简主义”

锁定9月13日，2025 AI创新者大会暨第二届提示工程峰会即将来袭

2025戴尔科技峰会 - 破局者 智行合璧

驭浪者无疆：智驱全球，无界新航

HPE Zerto Software 为企业数智化保驾护航

驭浪者无疆：智领未来 共拓蓝海

出海企业数据合规与安全

驭浪者无疆：跨越山海 以智驭远

驭浪者无疆：蜕变新生 以定驭变

昇腾AI开发者峰会

鲲鹏开发者峰会

驭浪者无疆：破界而生，重构制造新坐标

鲲鹏异腾开发者大会2025

算启当下 即见未来

AI Agent制造业落地实战-从技术场景到效益提升的应用场景全解析

用出海找出口，以科技领航全球新赛道

用出海找出口 驾驭“智造升维”的新变量

研华 x Jetson，加速突破边缘AI工业应用边界

用出海找出口——智造升级，全球布局

用出海找出口 从“本土制造”到“世界智链”的跃迁

借力打力 开天辟地——电信业如何借生成式AI之力，助推行业创新？

数据科学“茶水间——GTC导航篇

2024 亚马逊云科技 re:Invent

数字化转型有奖调研

数字化领航

2023 NVIDIA 初创企业展示报名开启

Gartner技术成熟度曲线揭示2025年重要人工智能创新

Gartner预测到2027年末，超过40%的代理型AI项目将被取消

Gartner：多元文化背景下加速企业出海的两大策略

Gartner：利用AI智能体，提升企业商业价值

Gartner：到2030年，守护代理将占据10%-15%的代理型AI市场份额

Gartner发布企业构建智能应用的五项基本原则

Gartner发布企业构建AI就绪型员工队伍的五个步骤

Gartner：2025年全球GenAI支出将达到6440亿美元

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

2025戴尔科技峰会 - 破局者智行合璧

驭浪者无疆：智领未来共拓蓝海

驭浪者无疆：跨越山海以智驭远

驭浪者无疆：蜕变新生以定驭变

算启当下即见未来

用出海找出口驾驭“智造升维”的新变量

用出海找出口从“本土制造”到“世界智链”的跃迁

借力打力开天辟地——电信业如何借生成式AI之力，助推行业创新？